Correlation Coefficient)
刻画了随机变量之间的线性相关程度
-
协方差的一种标准化形式,它通过除以两个变量的标准差来消除量纲和量级的影响,使得相关系数的值域在 -1 到 1 之间。
-
提供了一个无单位的度量,使得不同数据集的相关性可以进行比较。
-
的值越接近 1,线性相关程度越高; 的值越接近 0,线性相关程度越弱
-
:存在常数 使得 。也称为 的变换完全由 的线性函数给出
-
:称 不相关。
注意:
- 相互独立时,,称 不相关
- 但是 不相关,不一定能推出 相互独立
- (如果 服从二维正态分布,则:相互独立与不相关等价)
均方误差 :
最小二乘法
用 来近似 的均方误差
当 满足以下关系时,可以使得均方误差最小
均方误差的最小值: